A Survey of Text Representation and Embedding Techniques in NLP
نویسندگان
چکیده
Natural Language Processing (NLP) is a research field where language in consideration processed to understand its syntactic, semantic, and sentimental aspects. The advancement the NLP area has helped solve problems domains such as Neural Machine Translation, Name Entity Recognition, Sentiment Analysis, Chatbots, name few. topic of broadly consists two main parts: representation input text (raw data) into numerical format (vectors or matrix) design models for processing data. This paper focuses on former part surveys how evolved from rule-based, statistical more context-sensitive learned representations. For each embedding type, we list their representation, issues they addressed, limitations, applications. survey covers history representations 1970s onwards, regular expressions latest vector used encode raw It demonstrates progressed it could comprehend just bits pieces all significant aspects over time.
منابع مشابه
eplicitation in interlingual and intralingual translations of shahnameh ferdowsi: a text linguistic approach
بررسی و مقایسه تفاوتها و شباهت های ترجمه ی درون زبانی و برون زبانی با تمرکز بر زبانشناسی متن. برای امر مقایسه میزان بسامد تصریح به کار رفته در ترجمه ی درون زبانی و نیز برون زبانی شاهنامه ی فردوسی مورد بررسی قرار گرفت.
Spell Checking Techniques in NLP: A Survey
Spell checkers in Indian languages are the basic tools that need to be developed. A spell checker is a software tool that identifies and corrects any spelling mistakes in a text. Spell checkers can be combined with other applications or they can be distributed individually. In this paper the authors are discussing both the approaches and their roles in various applications.
متن کاملideological and cultural orientations in translation of narrative text: the case of hajji baba of isfahan
در میان عواملی که ممکن است ذهن مترجم را هنگام ترجمه تحت تأثیر قرار دهند، می توان به مقوله انتقال ایدئولوژی از طریق متن یا گفتمان اشاره کرد. هدف از این تحقیق تجزیه و تحلیل جنبه های ایدئولوژیکی و فرهنگی متن مبدأ انگلیسی نوشته جیمز موریه تحت عنوان سرگذشت حاجی بابای اصفهانی ( 1823) و ترجمه فارسی میرزا حبیب اصفهانی(1880) بوده است.
ذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ژورنال
عنوان ژورنال: IEEE Access
سال: 2023
ISSN: ['2169-3536']
DOI: https://doi.org/10.1109/access.2023.3266377